多近4万个真InDel!BGISEQ PCR-free重测序大揭秘!
如果在建库、测序过程中剔除PCR扩增过程,就能提高基因组的覆盖度,还能提高变异检测的准确性,更有利于进行基因组学研究。
今天给大家介绍的BGISEQ平台PCR-free重测序,不仅建库流程无PCR,测序流程也无PCR,最大程度避免了PCR引入的错误和偏向性,让测序得到的是真实的序列信息,更有利于检测真InDel。
文末有彩蛋!
BGISEQ建库测序实现真PCR-free
BGISEQ平台PCR-free重测序实现了建库和测序过程的真PCR-free。如图1所示,对于I平台,测序过程必须通过桥式PCR扩增获得分子簇(cluster),才能达到放大检测信号的目的,即使是PCR-free建库(图2),在建库测序过程中最少也要有一步PCR。
而基于DNBSEQTM技术的BGISEQ测序平台,如果采用PCR-free建库(图3),那么可以保证建库过程中样本制备不会引入扩增错误和扩增偏向性;测序过程中采用滚环扩增(Rolling circle amplification,RCA),只以最初的单链环状文库为模板进行线性扩增,不会有PCR过程中错误的累积,真正实现了从建库到测序的“0”PCR。所以BGISEQ平台PCR-free重测序将无扩增错误的PCR-free文库建库方法与无拷贝错误累积的DNBSEQTM技术结合起来,实现真正的全基因组PCR-free测序,还原基因组真相。
图1 I平台两步PCR测序
图2 BGISEQ平台和I平台一步PCR测序
图3 BGISEQ平台“0”PCR测序
InDel检测更“真”,更精准-多检测真InDel近4万个
与I平台的PCR建库测序相比,BGISEQ平台PCR-free重测序检测InDel精准度和敏感度高出近8个百分点,基因组高置信区多检测真InDel达37000多个。
与I平台的PCR-free重测序相比,BGISEQ平台PCR-free重测序在基因组高置信区多检测真InDel也近18000个。所以BGISEQ平台PCR-free重测序相比其他平台和PCR建库,能检测到更多真实InDel!
图4 各平台PCR-free和PCR建库测序变异精准度和敏感度比较
注:数据来源于NA12878标准品30X重测序数据(更多信息见https://mp.weixin.qq.com/s/bzq8uvEMvJwRLgOi-ligRw)。
PCR-free建库带来更高的基因组覆盖均一性
建库测序过程中,如果有PCR扩增过程对基因组覆盖度均一性有较大影响。对于DNA模板而言,有的二级结构复杂,有的热稳定性差异大,这些因素都会影响PCR扩增效率。所以,在PCR扩增过程中无法保证所有基因组片段都能获得相同的扩增效率,而是存在明显的扩增偏向性,譬如在基因组高GC或低GC区域覆盖度低。但是BGISEQ平台PCR-free重测序全程无PCR,与PCR建库测序相比,在基因组高GC区、AT/TA重复区域覆盖度有大幅提高。
图5 PCR-free建库相比于PCR建库在基因组不同特征区域覆盖度的提升
注:Huge GC(gc>80%)-GC 含量高于80%,长度大于100bp区域;AT Dinucleotides -AT或TA串联重复序列,长度大于30bp;数据来源于小鼠24X重测序数据。
如图6所示,BGISEQ平台 PCR-Free的重测序深度频率分布(图6-左图,红色柱状图)非常接近于泊松分布的理想的测序深度频率(图6-左图,蓝色线状图),说明测序数据具有很好的基因组覆盖均一性。
值得注意的是,虽然BGISEQ平台PCR-free建库测序结果比PCR建库好,但是后者测序结果与理想情况相差也不大。而I平台的PCR-free建库结果比较符合理想情况,但PCR建库结果与理想情况差距较大(图7)。对于重测序检测变异而言,为了保证检测结果的准确性,需要有多条测序reads支持,如果某个区域覆盖度低,会导致在这些区域检测的变异准确度无法保证可能被过滤掉,如果为了保证这些区域的覆盖深度达到检测要求,那么测序数据量要大幅提高,带来测序成本的增加。
图6 BGISEQ平台PCR-free建库(左)和PCR建库(右)重测序深度频率分布
注:数据来源于NA12878标准品30X重测序数据,红色柱状图为测序深度频率统计结果,蓝色线图为符合泊松分布的理想测序深度频率。
图7 I平台PCR-free和PCR建库测序深度频率分布[4]
注:图片来源于官方渠道。
所以BGISEQ平台PCR-free重测序没有PCR扩增步骤,可以避免扩增引入的偏向性,具有更好的基因组覆盖均一性,更适合GC含量异常物种的重测序。统计不同GC含量的细菌测序结果GC偏向性,如图8-10所示:以100个碱基的大小为窗口,绘制GC含量分布图。灰色水平线表示理想的归一化覆盖度,表示为1.0, 蓝色点线表示样本的实际归一化的覆盖度。蓝色点线越接近1.0, 说明样本的基因组覆盖均一性越好。测序结果表明,BGISEQ平台PCR-free文库测序对于高GC、低GC物种基因组覆盖均一性与GC正常物种表现非常接近。
图8 GC含量62%的细菌(Olsenella Profusa)测序结果GC偏向性统计结果
图9 GC含量50%的细菌(E.coli)测序结果GC偏向性统计结果
图10 GC含量38%的细菌(Bacillus megaterium)测序结果GC偏向性统计结果
注:数据来源于3种不同GC含量的细菌30X测序
5742个商业文库数据表现稳定
BGISEQ平台PCR-free重测序不仅测试结果表现优异,在商业项目中,表现也很稳定。统计5492个文库动植物BGISEQ平台PCR-free重测序数据,下机数据Raw data %20平均为96.95,%30平均为89.14。
图11 动植物BGISEQ PCR-free重测序下机数据质量
统计250个 BGISEQ PCR-free 人重文库测序结果,数据表现同样优秀。
①下机数据Raw data %Q20平均为97.36,%Q30平均为90.01。
图12 人重BGISEQ PCR-free测序质量
② %GC含量平均值41.62%,符合人基因组序列特征。
图13 人重BGISEQ PCR-free 测序GC含量
③比对率平均值达到99.78%。
图12 人重BGISEQ PCR-free 测序比对率
④平均Duplicates比率2.36%,意味着用更少的Raw Data可以获得更高的有效深度和基因组覆盖度。
图13 人重BGISEQ PCR-free 测序Duplicates_Rate
重磅促销
即日起至2019年7月31日,
动植物重测序和
人重BGISEQ平台PCR-free重测序
新签项目,
PCR-free文库享7.5折优惠。
优惠多多,不要错过哟!
立即预定
参考文献
[1] Mcinerney P, Adams P, Hadi M Z. Error Rate Comparison during Polymerase Chain Reaction by DNA Polymerase.[J]. Molecular Biology International, 2014, 2014:287430.
[2] Aird D, Ross M G, Chen W S, et al. Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries[J]. Genome Biology, 2011, 12(2):R18.
[3] Han F, Wu Y, Narzisi G, et al. Reducing INDEL calling errors in whole genome and exome sequencing data[J]. Genome Medicine,6,10(2014-10-28), 2014, 6(10):89.
[4]https://www.illumina.com/content/dam/illumina-marketing/documents/products/datasheets/datasheet_truseq_dna_pcr_free_sample_prep.pdf
撰稿:小 萍
编辑:市场部
近期热文
同1个cell,5倍有效数据!华大5X全长转录组如何实现的?
请继续关注“华大科技BGITech”,
科技君将一如既往为您提供精彩内容!
如有相关问题,欢迎后台留言~~
▼
关注华大科技,尽享精彩科研!
👇👇👇点此了解更多分析数据